<html>
 <head>
  <meta charset="utf-8"/>
  <meta content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no" name="viewport"/>
  <title>
   Editor: 一种使用SEM广告展现数据优化投放策略的方法  | 数螺 | NAUT IDEA
  </title>
  <link href="http://cdn.bootcss.com/bootstrap/3.3.6/css/bootstrap-theme.min.css" rel="stylesheet"/>
  <link href="http://cdn.bootcss.com/bootstrap/3.3.6/css/bootstrap.min.css" rel="stylesheet"/>
  <style type="text/css">
   #xmain img {
                  max-width: 100%;
                  display: block;
                  margin-top: 10px;
                  margin-bottom: 10px;
                }

                #xmain p {
                    line-height:150%;
                    font-size: 16px;
                    margin-top: 20px;
                }

                #xmain h2 {
                    font-size: 24px;
                }

                #xmain h3 {
                    font-size: 20px;
                }

                #xmain h4 {
                    font-size: 18px;
                }


                .header {
	           background-color: #0099ff;
	           color: #ffffff;
	           margin-bottom: 20px;
	        }

	        .header p {
                  margin: 0px;
                  padding: 10px 0;
                  display: inline-block;  
                  vertical-align: middle;
                  font-size: 16px;
               }

               .header a {
                 color: white;
               }

              .header img {
                 height: 25px;
              }
  </style>
  <script src="http://cdn.bootcss.com/jquery/3.0.0/jquery.min.js">
  </script>
  <script src="http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=TeX-AMS-MML_HTMLorMML" type="text/javascript">
   MathJax.Hub.Config({
          tex2jax: {inlineMath: [['$','$'], ['\\(','\\)']]},
          TeX: {equationNumbers: {autoNumber: "AMS"}}
        });
  </script>
  <script src="http://nautstatic-10007657.file.myqcloud.com/static/css/readability.min.js" type="text/javascript">
  </script>
  <script type="text/javascript">
   $(document).ready(function() {
                 var loc = document.location;
                 var uri = {
                  spec: "http://cos.name/2016/05/sem-data-optimization-strategy/",
                  host: "http://cos.name",
                  prePath: "http://cos.name",
                  scheme: "http",
                  pathBase: "http://cos.name/"
                 };
    
                 var documentClone = document.cloneNode(true);
                 var article = new Readability(uri, documentClone).parse();
     
                 document.getElementById("xmain").innerHTML = article.content;
                });
  </script>
  <!-- 1466442603: Accept with keywords: (title(0.444444444444):策略,数据,方法,服务平台,统计学,广告,门户网站,中国,优化, topn(0.366666666667):截面,搜索引擎,广告主,成本,数据分析,消费者,层面,结果,模型,关键词,素材,力度,数据,市场,抽样,广告条,样本,品牌,竞争对手,客户,竞品,优化,百度,策略,部分,方法,广告,文本,行业,竞争者).-->
 </head>
 <body class="single single-post postid-12015 single-format-standard sidebar" onload="">
  <div class="header">
   <div class="container">
    <div class="row">
     <div class="col-xs-6 col-sm-6 text-left">
      <a href="/databee">
       <img src="http://nautidea-10007657.cos.myqcloud.com/logo_white.png"/>
      </a>
      <a href="/databee">
       <p>
        数螺
       </p>
      </a>
     </div>
     <div class="hidden-xs col-sm-6 text-right">
      <p>
       致力于数据科学的推广和知识传播
      </p>
     </div>
    </div>
   </div>
  </div>
  <div class="container text-center">
   <h1>
    Editor: 一种使用SEM广告展现数据优化投放策略的方法
   </h1>
  </div>
  <div class="container" id="xmain">
   <div class="hfeed site" id="page">
    <header class="site-header" id="masthead" role="banner">
     <div id="cos-logo">
      <a href="http://cos.name/">
       <img src="http://cos.name/wp-content/themes/COS-kermesinus/images/headers/cos-logo.png"/>
      </a>
     </div>
     <div class="navbar" id="navbar">
      <nav class="navigation main-navigation" id="site-navigation" role="navigation">
       <h3 class="menu-toggle">
        菜单
       </h3>
       <a class="screen-reader-text skip-link" href="http://cos.name/2016/05/sem-data-optimization-strategy/#content" title="跳至内容">
        跳至内容
       </a>
       <div class="menu-%e6%88%91%e7%9a%84%e8%8f%9c%e5%8d%95-container">
        <ul class="nav-menu" id="menu-%e6%88%91%e7%9a%84%e8%8f%9c%e5%8d%95">
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-home menu-item-4746" id="menu-item-4746">
          <a href="http://cos.name">
           主页
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-has-children menu-item-8120" id="menu-item-8120">
          <a href="http://cos.name/cn">
           论坛
          </a>
          <ul class="sub-menu">
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8124" id="menu-item-8124">
            <a href="http://cos.name/cn/wp-login.php?action=register">
             论坛注册
            </a>
           </li>
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8125" id="menu-item-8125">
            <a href="http://cos.name/cn/wp-login.php">
             论坛登录
            </a>
           </li>
          </ul>
         </li>
         <li class="menu-item menu-item-type-post_type menu-item-object-page menu-item-8110" id="menu-item-8110">
          <a href="http://cos.name/books/">
           图书资料
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8112" id="menu-item-8112">
          <a href="http://cos.name/videos">
           视频教程
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8333" id="menu-item-8333">
          <a href="http://cos.name/salon/">
           统计沙龙
          </a>
         </li>
         <li class="menu-item menu-item-type-post_type menu-item-object-page menu-item-8111" id="menu-item-8111">
          <a href="http://cos.name/chinar/">
           R语言会议
          </a>
         </li>
         <li class="menu-item menu-item-type-post_type menu-item-object-page menu-item-8109" id="menu-item-8109">
          <a href="http://cos.name/training/">
           讲座与培训
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8115" id="menu-item-8115">
          <a href="http://cos.name/cn/forum/comprehensive/job/">
           招聘信息
          </a>
         </li>
         <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-has-children menu-item-4780" id="menu-item-4780">
          <a href="http://cos.name/about">
           关于我们
          </a>
          <ul class="sub-menu">
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8113" id="menu-item-8113">
            <a href="http://cos.name/2008/11/how-to-work-with-cos/">
             加入我们
            </a>
           </li>
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8119" id="menu-item-8119">
            <a href="http://cos.name/donate/">
             赞助我们
            </a>
           </li>
           <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-8114" id="menu-item-8114">
            <a href="http://cos.name/cn/forum/26">
             项目合作
            </a>
           </li>
          </ul>
         </li>
        </ul>
       </div>
       <form action="http://cos.name/" class="search-form" method="get" role="search">
        <label>
         <span class="screen-reader-text">
          搜索：
         </span>
        </label>
       </form>
      </nav>
      <!-- #site-navigation -->
     </div>
     <!-- #navbar -->
    </header>
    <!-- #masthead -->
    <div class="site-main" id="main">
     <div class="content-area" id="primary">
      <div class="site-content" id="content" role="main">
       <article class="post-12015 post type-post status-publish format-standard hentry category-website" id="post-12015">
        <header class="entry-header">
         <h1 class="entry-title">
          一种使用SEM广告展现数据优化投放策略的方法
         </h1>
         <div class="entry-meta">
          <span class="date">
           <a href="http://cos.name/2016/05/sem-data-optimization-strategy/" rel="bookmark" title="链向一种使用SEM广告展现数据优化投放策略的方法的固定链接">
            <time class="entry-date" datetime="2016-05-19T23:22:52+00:00">
             2016/05/19
            </time>
           </a>
          </span>
          <span class="categories-links">
           <a href="http://cos.name/category/website/" rel="category tag">
            统计之都
           </a>
          </span>
          <span class="author vcard">
           <a class="url fn n" href="http://cos.name/author/editor/" rel="author" title="查看所有由COS编辑部发布的文章">
            COS编辑部
           </a>
          </span>
         </div>
         <!-- .entry-meta -->
        </header>
        <!-- .entry-header -->
        <div class="entry-content">
         <p>
          <strong>
           作者：
          </strong>
          常莹 (
          <em>
           北京博雅立方科技有限公司)
          </em>
         </p>
         <p>
          摘要：本文主要介绍了一种使用公开的SEM广告展现数据，判断行业竞争态势及竞争对手动向、并进而优化SEM投放的方法。此方法由SEM第三方代理公司根据教育培训行业客户的通用需求研发，但具备通用性，可以便捷地复制到其他行业或供某一广告主使用。研究中所使用的主要数据是搜索引擎公开展示的SEM广告。整套方法由一个概念模型和一系列用于完成具体数据分析任务的描述性统计方法组成。分析结果包含一套刻画行业(也可以是子行业/业务线/竞争对手/行业重要关键词等维度)SEM广告投放策略特征及变化趋势的图表，以及据此生成的对市场趋势的判断和优化投放建议。这种方法所需的数据容易获取、方法可扩展性好，产出可用来制定有针对性的投放策略和优化方案，是一种非常经济监控竞品以及提升广告投放效果的方法。
          <span id="more-12015">
          </span>
         </p>
         <h4>
          <strong>
           <b>
            一、问题的引入
           </b>
          </strong>
         </h4>
         <p>
          中国互联网信息中心(CNNIC)于2016年1月发布数据显示，我国网民规模在2015年底已达6.9亿，其中82%的网民使用搜索引擎。互联网和搜索引擎成为终端消费者的重要聚集地，必然会带动企业将营销推广重心向线上及搜索引擎转移。有超过1/3的企业开拓有至少一个互联网营销渠道，其中近半数在进行SEM推广。SEM是Search Engine Marketing的首字母简写词，是广告主在搜索引擎上投放的竞价关键字广告。这种广告形式带来的收入在互联网广告总体收入中的占比已接近40%，是广告主进行线上营销最重要的推广方式。
         </p>
         <p>
          教育培训行业是在营销上高度依赖搜索引擎的代表性行业之一。根据国内市场份额最大的搜索引擎百度发布的财报，该行业一直是SEM广告投入最高的五个行业之一。它表现出两个鲜明的特征：首先，行业快速发展，前景看好，(据估计行业规模将在几年内超过万亿)。其次，业内竞争者众多，业内领先品牌的优势仍然主要体现在市场占有率方面，各品牌的产品和服务差异化程度不高。这使得想要维持或扩大市场规模的竞争者高度依赖市场推广，SEM广告作为其最为重要的推广手段之一更是从业者彼此竞争的重点领域。各品牌的推广成本随着竞争激烈程度的提高不断飙升，单位客户成本甚至在近两年内即接近翻番，给企业盈利造成了巨大压力。
         </p>
         <p>
          激烈的竞争使得教育培训行业各品牌之间的攻防意愿非常强烈。广告主都希望能够全面了解市场大势及竞品动向，在知己知彼的基础上有针对性地制定自己的推广策略。但实际情况与广告主的期望有很大差距。绝大部分广告主(包括行业领先的厂商)，对市场趋势及竞争对手的监控都还停留在手工随机查看对手广告或零星搜集商业情报的阶段，缺乏系统的方法论和高效的实施方法。
         </p>
         <p>
          笔者所服务公司是百度五星级代理商之一，公司在教育培训行业有十分丰富的服务经验。有感于客户对知己知彼及成本可控两个目标的迫切愿望，公司为教育培训行业定制了由复合转化模型与品牌观察模型组成的解决方案。前者通过打通在线推广与在线转化数据，帮助客户优化推广资源分配。后者帮助客户监控市场及竞品的重要动向，并提供推广优化建议。本文介绍品牌观察模型结构与实施。它所使用的数据较易获取，所需开发工作量相对可控，分析结果可供对SEM广告策略各主要方面进行优化，是一种性价很高的市场监控方式。
         </p>
         <h4>
          <strong>
           <b>
            二、
           </b>
          </strong>
          <strong>
           <b>
            问题与数据描述
           </b>
          </strong>
         </h4>
         <p>
          为行文便利起见，以下将以笔者所在公司为客户A提供的一次品牌观察模型服务为例子进行说明。其他客户、多个搜索引擎以及类似广告形式的监控，皆可以类似的方法得到。
         </p>
         <p>
          客户A是职业教育培训领域领先的上市公司，SEM推广带来的客户在其客户总量中的占比约70%。因近年在搜索营销方面投入巨大，A公司受到了来自资本市场的紧迫压力，急需控制推广成本、提升推广效果。同时，作为所在行业的标杆企业之一，业界众多竞品也一直在试图通过抢夺A的(潜在)客户资源来扩大自身的市场份额。为了守护并继续扩大自身的市场份额，A需要及时根据市场情况做出应对。A面临的挑战正是品牌观察模型所要解决的问题。
         </p>
         <p>
          实施此方法需要准备两份数据：行业关键词样本、样本关键词激发的SEM广告。首先对SEM广告的基本业务逻辑做简要介绍。图1是百度提供的一个典型的、呈现了SEM广告的搜索结果页。SEM广告以关键词为单位，广告主购买的每一个关键词都是一条广告。用户在页面最上端的搜索框(左侧上方方框)中输入搜索词后会看到搜索结果页。如果这个搜索词恰好也是某些广告主购买的关键词广告的话，就会有广告被呈现出来，否则就只会呈现自然搜索结果。
         </p>
         <p>
          广告以图1中右侧方框框出的“推广链接”为标识。广告语(左侧中间方框)被称为“创意”，由广告主根据关键词内容撰写，第一行为“标题”、余下为“描述”；创意中与搜索词匹配度最高的部分以红色显示，称为“飘红”；“显示URL”(左侧下方方框)可用来识别购买广告的广告主。创意和显示url合并在一起，组成一条完整的关键词广告。广告主为每一个关键词设定一个“出价”，当多个广告主同时购买一个关键词，出价是决定各广告主广告排名的关键性因素。广告被点击时，广告主向搜索引擎支付一定费用。上述说明对SEM广告的业务逻辑进行了适度简化，有兴趣的读者请查阅相关文档。
         </p>
         <pre><a href="http://cos.name/wp-content/uploads/2016/05/H92YQSI75A9XBAIU7VPH.png"><img src="http://cos.name/wp-content/uploads/2016/05/H92YQSI75A9XBAIU7VPH.png"/></a>                        图1百度搜索结果页SEM广告示意图</pre>
         <p>
          “行业关键词样本”，是自图1左侧上方方框中客户输入的搜索词中选取出来的一个样本。之后通过爬虫或搜索引擎提供的API接口，轮循抓取并记录搜索每个关键词时结果页上呈现的广告，即为“样本关键词激发的SEM广告”数据。具体的数据获取方式如下：
         </p>
         <p>
          行业关键词样本对应的总体，是该行业所有广告主在百度购买过的关键词总和；只有百度掌握这一数据，并且不会向任何代理商和广告主开放。品牌观察模型以笔者所在公司自行建立的行业词库中包含的全部关键词作为真实总体的替代。这一词库中的关键词来自于三个来源：一、公司服务过的该行业广告主购买过的关键词；二、通过搜索引擎提供的拓词接口增补的关键词；三、在相关网站抓取的文本中提炼出来的关键词。该词库是可获取到的、对真正总体最为近似的模拟。无论是真实总体还是公司行业词库，所包含的关键词数量都非常庞大；而抓取广告数据是需要消耗一定资源，出于成本考虑，需要选取一个有代表性的关键词样本。
         </p>
         <p>
          品牌观察模型采取分层抽样的方式选取样本。分层标准是行业词库中的分类及子类。表1提供部分关键词示例。分类中的“通用词”指可以标识行业的关键词，“产品词”是能够标示某一种产品/服务的关键词，“品牌词”包含行业中某一公司的品牌名称。对每一分类都可进一步细分，通常至少会将品牌词按照关键词对应的品牌细分。一个成熟的SEM账户通常会涵盖各个类别的关键词，以便全面接触具有各种搜索习惯、处于购买决策各个阶段的潜在客户；这是品牌观察模型在对关键词进行抽样时选择分层抽样方法的主要原因。“搜索量”表示搜索此关键词的用户数量大小，此处有模糊化处理。搜索量由搜索引擎通过API接口提供，按照一定时间周期更新。
         </p>
         <pre><a href="http://cos.name/wp-content/uploads/2016/05/5652.tmp_.png"><img src="http://cos.name/wp-content/uploads/2016/05/5652.tmp_.png"/></a></pre>
         <p>
          本案例共选择了3,300个关键词样本。在从百度抓取样本关键词激发的广告时，可供选择的方式有爬虫和百度提供的搜索实况API两种。前者适用于任何搜索引擎；但需自行开发部署抓取程序，其稳定性面临搜索引擎封禁等问题的挑战。以外，过于频繁的抓取频率会降低关键词的点击率，进而影响关键词的排名位置。因此抓取页面的频率不可过于频繁。后者在开发成本和稳定性方面表现相对较好，不会影响关键词点击率；但不能移植到其他搜索引擎，且获取配额有一定门槛，需求量过大还需向百度支付费用。本案例使用公司现有的免费搜索实况API，所得数据如被表2所示：
         </p>
         <pre><a href="http://cos.name/wp-content/uploads/2016/05/BF15.tmp_.png"><img src="http://cos.name/wp-content/uploads/2016/05/BF15.tmp_.png"/></a></pre>
         <table style="height: 5px;" width="586">
          <tbody>
           <tr>
            <td width="349">
            </td>
           </tr>
          </tbody>
         </table>
         <p>
          本案例在抓取广告时，将一天分为4个等长时段，每个时段对全部样本关键词抓取一遍其在北京(不同地区的广告展示结果可能不同)的广告展现结果，并令一个关键词在某一时段内的抓取时间服从均匀分布。以2016年3月28日至4月3日一周为例，共回收67.9万条广告，共有2,713个广告主至少有一次广告展现，平均每次搜索展现14.1条广告。表3是抓取数据中回收到的每个广告主的广告数量、每个广告主购买的关键词个数这两个变量的四分位数。两个变量的分布都严重右偏，少数广告主占领了绝大多数广告展现资源，大量中小广告主仅进行非常小规模的投放。中位数之下的广告主绝大部分并不从事职业教育培训，只是偶然购买了关键词样本中的一个关键词。例如代理会计服务行业广告主也会购买关键词样本中的关键词“会计”。删除这些非本行业的数据，留下1,677个广告主。
         </p>
         <pre><a href="http://cos.name/wp-content/uploads/2016/05/290F.tmp_.png"><img src="http://cos.name/wp-content/uploads/2016/05/290F.tmp_.png"/></a></pre>
         <p>
          通常行业领先的广告主更关注与其规模相当或接近的竞争者，表4选择了包括客户A在内的、占有广告资源最多的5个广告主，展示它们占用广告资源的基本情况。A是5个广告主中广告展现最多的一个，同时其关键词平均排名也远低于竞争对手。这通常意味着，广告主A为了维持更好的关键词展现位置，采用了普遍的高出价策略以维持大量关键词在更好的排名位置展现；它正是造成之前提到的、推广成本快速增加的主要原因。其他四个竞争对手在关键词数量上与A相差不多，出价策略相对保守，因此其展现位置明显偏低(平均排名数值更大)、同时会有更多广告不能展现的情况(每个关键词平均展现广告数较A明显偏低)。综上，A以高额的广告费用维持了更充分地曝光，竞争者B、C、D、E的出价策略远不如A激进，有利于控制成本，但牺牲了部分曝光量和更好的展现位置。
         </p>
         <pre><a href="http://cos.name/wp-content/uploads/2016/05/A69E.tmp_.png"><img src="http://cos.name/wp-content/uploads/2016/05/A69E.tmp_.png"/></a>
</pre>
         <h4>
          <strong>
           <b>
            三、
           </b>
          </strong>
          <strong>
           <b>
            分析方法与实施
           </b>
          </strong>
         </h4>
         <p>
          品牌观察模型主要用于帮助客户了解所在行业的整体竞争态势、剖析主要竞争者的策略特征与重要变动；并在此基础上，制定富有竞争力的投放策略与落实计划。模型由行业层面和策略层面两个部分的分析组成。行业层面的分析主要完成如下几个任务：描绘投放市场竞争格局、圈定竞争对手、预判投放市场发展趋势。策略层面的分析主要围绕竞争者之间攻防格局、各广告主关键词及资源配比、创意热点三个方面展开，为使用者提供增删关键词、调整关键词价格、撰写创意素材建议三个方面的优化措施。品牌观察模型既可在单独提取某段时间的数据进行一次性的分析，也可将各次分析的结果进行对比，前者是后者的基础。以下将主要陈述截面上的分析方法，加入时间轴后的分析主要是采取同比/环比/时间序列模型等手段定位变化异常的指标、广告主和关键词，不再一一赘述。
         </p>
         <h5>
          <strong>
           <b>
            （
           </b>
          </strong>
          <strong>
           <b>
            一）
           </b>
          </strong>
          <strong>
           <b>
            行业层面分析
           </b>
          </strong>
         </h5>
         <p>
          为方便说明计算逻辑，首先定义符号。假定分析中共涉及到m个广告主，对其按照抓取广告条数倒序排列，编号为1,2，……，m。关键词抽样共包含n个关键词，编号为1,2，……，n；n个关键词的搜索量分别为。是0-1变量，抓取到第i个广告主关于第j个关键词至少一条广告时取值为1，否则为0；表示抓取到第i个广告主关于第j个关键词的广告条数。显然时，；时，。对于的(i,j)，以表示第i个广告主关于第j个关键词抓取到的各条广告的排名。于是对于每一个的(i,j)，第i个广告主关于第j个关键词的平均排名为。
         </p>
         <p>
          行业层面的分析包含截面和时序两个部分，前者主要了解当前的推广格局，后者主要用于追踪市场发展趋势。截面上的分析采用四象限分析法，可识别市场上众多竞争者在SEM推广上的竞争地位和基本推广策略，展现形式如图2所示。图中的纵轴“品牌推广度指数”是广告主购买的各关键词的搜索量的加权汇总，体现某一品牌希望在线上市场上取得的品牌地位。对于第i个广告主，该指数计算公式如下：。
         </p>
         <p>
          上式以广告条数和平均排名对广告主购买的关键词检索量进行了加权。这是因为，即使两个广告主都购买了某个关键词，但是在同样的抓取条件下，获得的广告数越多(越大)，说明客户在搜索关键词时看到该广告主广告的可能性越大，广告主在此关键词上的投入通常也越高。同理，平均排名越靠前(越小)，在此关键词上的投入通常也更高，因此平均排名以倒数的形式进行加权。
         </p>
         <p>
          很多行业存在淡旺季，行业的推广力度会随时间整体性地发生明显变化。同时关键词表抽样也不是一成不变的，会随市场的发展有所增删。比如2009年之前，电商行业的关键词抽样中不会有“双十一”类的词，但是在双十一成为大促节点后，一个有代表性的关键词抽样必然要囊括此类关键词的代表。为便于比较各广告主在不同时段的推广力度的差异，通常要对原始的品牌推广度指数进行标准化处理，得到。
         </p>
         <p>
          <!--StartFragment -->
         </p>
         <pre><img src="file:///C:\Users\Administrator\AppData\Roaming\Tencent\Users\2838398402\QQ\WinTemp\RichOle\86}QAT_B4ORVNK4E}3B~ZG1.png"/><a href="http://cos.name/wp-content/uploads/2016/05/86QAT_B4ORVNK4E3BZG1.png"><img src="http://cos.name/wp-content/uploads/2016/05/86QAT_B4ORVNK4E3BZG1.png"/></a>                             图2行业层面-截面-示意图

</pre>
         <p>
          图2的横轴“品牌知名度指数”代表某广告主当前被线上消费者认知的程度。获取这一数据方式之一是对样本关键词表中每个广告主对应的品牌词的检索量取平均值，即。之后再对进行标准化，得到。对于那些行业公开数据较为丰富的行业，可以选取其他更能代表广告主整体实力的指标，例如市场份额、营收或利润等。
         </p>
         <p>
          得到和之后，即可绘制如图2所示的图形。广告主被分隔为四个区域：知名度高也大力推广的“领导者”，知名度高但是推广策略保守的“追随者”，以相对自己知名度要强的力度提升市场地位的“挑战者”，实力不高也无力支撑高额推广费用或专注于某一细分市场的“拾遗补缺者”。在具体使用过程中，这张图会为使用者提供至少以下三种方面的重要信息：
         </p>
         <p>
          第一、自己在哪个象限？与目标或预期是否有差距？差距在哪个方向？
         </p>
         <p>
          第二、自己的对手和挑战目标是谁？要特别注意那些在图上离自己距离近的广告主，或者是那些表现与自己预期不符的广告主。
         </p>
         <p>
          第三、位于挑战者区域的广告主，在以相对自身知名度更强的力度推广，它们通常在试图改变自己市场地位，值得所有竞争者关注。
         </p>
         <p>
          最后提示一个特例，位于“追随者”象限的竞争者，通常是处于收缩或衰退阶段，因而推广策略相对保守的广告主，但也有例外。当一个品牌强大到成为一个行业里绝对的强势品牌时，即使它只投放很少的广告，消费者也会主动去搜索他们。这样的品牌通常出现在图形中非常偏右的位置，它们不是在追随他人，而是在领跑市场。
         </p>
         <p>
          接下来通过各品牌的推广力度计算整个市场的推广力度指数。它通常受到两个因素的影响：整个行业的广告主数量、各广告主的推广力度。可采用如下公式计算：。使用未经标准化的品牌推广度指数，可以捕捉市场推广力度的变化。推广力度最大的100名品牌的推广力度指数之和表示市场总体推广力度，业内广告主数量m表示市场规模；两者中的任何一个扩大，都表示市场竞争激烈程度的增加。
         </p>
         <p>
          当监控持续进行的时候，、和会扩展为包含时间维度的形式、和。这些指数随时间推进发生的重大变化(如im或某个品牌的IF指数的剧烈变动)，也是需要重点关注的信息。
         </p>
         <h5>
          <strong>
           <b>
            （
           </b>
          </strong>
          <strong>
           <b>
            二）
           </b>
          </strong>
          <strong>
           <b>
            策略层面分析
           </b>
          </strong>
         </h5>
         <p>
          SEM投放涉及很多具体工作，例如应选取哪些关键词、如何设置账户结构、如何撰写创意、如何为关键词出价和调价、如何设置匹配模式等。本节主要讨论如何通过公开的广告数据提炼竞争对手在以下三个方面的策略特征：
         </p>
         <p>
          第一、品牌攻防策略：是否主动攻击竞品、攻击范围和力度、对来自对手的进攻是否进行了有效防守等
         </p>
         <p>
          第二、关键词购买及出价：关键词配置是否能够合理有效地覆盖到潜在消费者、出价策略的激进程度、如何找到关键词购买和出价方面的提升空间等
         </p>
         <p>
          第三、广告创意：客户的广告创意与其自我定位是否一致、主要竞品如何设定品牌形象、哪些创意点可以成为品牌特色等
         </p>
         <p>
          品牌攻防策略部分以截面分析为主，具体实现方法如下：
         </p>
         <p>
          1、选定分析的品牌范围(A、B、C、D、E)，在关键词抽样中的品牌词类别下，选择与A及B、C、D、E对应的全部品牌词
         </p>
         <p>
          2、在广告数据中选择关键词为1中选定的品牌词、展示url为上述五个品牌之一的广告，得到如表5所示数据
         </p>
         <p>
          3、在进行品牌攻防时，广告主既会购买包含自己品牌名称的关键词，也会购买包含竞品品牌的关键词以抢夺对方市场份额。广告主与品牌实际上是一一对应的同一批实体，在涉及购买关键词行为时，以“广告主”来称呼这一实体，而在同一实体作为被同行攻击的对象时，则称其为“品牌”
         </p>
         <pre><a href="http://cos.name/wp-content/uploads/2016/05/9820.tmp_.png"><img src="http://cos.name/wp-content/uploads/2016/05/9820.tmp_.png"/></a></pre>
         <table>
          <tbody>
           <tr>
            <td width="223">
            </td>
           </tr>
          </tbody>
         </table>
         <p>
          4、假定分析涉及个广告主，关键词样本中关于每个品牌的关键词个数分别为，第个品牌对应的第k个品牌关键词的搜索量为。以表示第i个品牌对应的第k个关键词是否被第j个广告主购买，是则取1，否则取0；则广告主j购买品牌i的品牌关键词在品牌i所有关键词中的占比即为。越大，表示广告主j对于品牌i的品牌词购买得越全面，从而对品牌i的竞争意图越强烈。
         </p>
         <p>
          对于每一个，以表示第i个品牌对应的第k个关键词被第j个广告主所购买时，爬虫抓取到的广告条数；则广告主j在其所购买的所有品牌i关键词的词均广告展现次数为。这个值越大，表示消费者在搜索品牌i的品牌词时，越有可能看到广告主j的广告，从而广告主j抢夺品牌i的市场份额的意图越强烈。
         </p>
         <p>
          对于每一个，以表示第i个品牌对应的第k个关键词被第j个广告主所购买时，爬虫抓取到的广告的平均排名；则广告主j购买品牌i的品牌关键词的广告展现平均排名为。这个值越小，表示消费者在搜索品牌i的品牌词时，会同时看到广告主j的广告并且其排名位置越靠前，从而广告主j抢夺品牌i的市场份额的意图越强烈。
         </p>
         <p>
          在分析时，可以将直接以来表示广告主之间的竞争强度，也可以对加权，构造综合指数。综合了更多因素，可以更为全面地反映一个品牌的推广力度，但是这个指标的业务意义相对不如直接清晰；在实际应用中，通常会将它们结合在一起使用。
         </p>
         <pre><a href="http://cos.name/wp-content/uploads/2016/05/YV9NLQCCFG31A9YJ1FM.png"><img src="http://cos.name/wp-content/uploads/2016/05/YV9NLQCCFG31A9YJ1FM.png"/></a></pre>
         <p>
          表6可从三个方向解读：
         </p>
         <p>
          1、每一列表示一个广告主以哪些竞争者为攻击对象，以及攻击各竞争者的力度。如果A列在与B、C、D、E各行相交的位置数值都很高，则A在非常主动地抢夺四个竞争对手的用户；它攻击其他竞争者的意图非常强烈。
         </p>
         <p>
          2、每一行表示每个品牌遭到哪些竞争者的攻击，以及被攻击的力度大小。举例来说，如果A行在与B、C、D、E各列相交的位置数值都很高，那么B、C、D、E都在非常主动地想从A手中抢夺客户和市场份额；这样的品牌通常是市场上第一阵营中的品牌，也有可能是处于衰落过程中的品牌。
         </p>
         <p>
          3、对角线表示各个竞争者在攻击其他人之余，是否做好了防守。如果一个广告主在自己所在列的其他位置数值都很高，只是在列与对角线交叉的位置取值很小，那么这个竞争者在全力攻击竞争者，但是却遗漏了很多与自己品牌相关的关键词。
         </p>
         <p>
          上述分析的结论，可以被落实为具体的推广优化方案：广告主可以根据行业各主要品牌被攻击的集中程度，斟酌是否调整主攻品牌的范围。此外，广告主可以购买那些尚未购买的自身及主攻对手的品牌关键词(较小的品牌对应的的词)；对于已购买的品牌词，可以考虑是否要调高那些展现机会较少(主攻的目标品牌对应的较小的关键词)或排名较为靠后的关键词(主攻的目标品牌对应的较大的关键词)的出价，让自己可以有更多的机会第一时间展现在潜在消费者面前。
         </p>
         <p>
          品牌词抽样一旦确定一般会比较稳定，对于监控时间较长的品牌，此部分还会监控等指标在时间轴上的变化趋势，一旦发现市场上各主要品牌的攻防对象及强度的变化即随同发布相关广告主和品牌的详细变化情况。
         </p>
         <p>
          第二个策略特征与关键词购买及出价有关，用于检查广告主对关键词的资源分配是否合理。由此衍生的优化建议主要用于帮助广告主调整关键词结构、调整关键词出价，进而控制投放成本；包含两个方向的截面分析。
         </p>
         <p>
          第一个方向的分析用于判断广告主购买的关键词配比是否合理，分析结果以图3所示的方式展示。沿用行业层面分析中的符号定义。图3中横轴“流量覆盖率”衡量每个广告主覆盖的广告流量在全行业广告流量中的占比，对广告主i，有；纵轴“关键词覆盖率”衡量每个广告主购买的关键词数量在全行业关键词中的占比，对广告主i，有。
         </p>
         <p>
          从表1提供的关键词表样本中，可以看到搜索不同关键词的消费者数量差异很大。一些行业强势品牌的品牌词、核心产品词搜索量很大，购买这样的关键词可以接触到大量的用户，而且它们通常也是消费者在决策关键阶段必然会搜索的词。行业内的每个广告主都会或多或少购买一些这样的词。而消费者每次搜索看到的广告条数是有上限的，广告主想要保证自己的广告可以被展现出来，就需要为它们出较高的价格。一个行业内，符合这一类特征的词，通常数量有限，广告主对它们的竞争激烈，导致这些词的价格也是行业中最高的，它们被称为“热门词”。热门词之外，还有大量搜索量中等或较小、竞买广告主数量较少、价格也低的关键词，它们通常被用来捕获细分市场用户、聚集长尾消费者，因此被称为“长尾词”。
         </p>
         <p>
          热门词保量，长尾词拉低平均成本，通常广告主购买关键词时会在两者之间保持一定平衡，分布在如图3中对角线所示位置附近。过多地购买长尾词、热门词不足的广告主会处于图中左上位置，他们可以将关键词点击成本控制在极低的水平上，但能够接触到的消费者数量受限、也可能错失一些消费者决策的关键环节。这种策略通常不能够像广告主所期望地那样，带来较低的最终的获客成本。与之相对，位于图中的右下角的广告主，长尾词不足，虽然能够有效接触到市场上绝大部分的需求和用户的主要购买决策环节，但成本通常较高、也易错失某些关键的细分市场。除了对每一个广告主购买的全体关键词进行此项分析外，还可以将分析的维度细化到某一个广告主所购买的每一类关键词上。
         </p>
         <p>
          对于在整体或某一类关键词的投放上结构有所偏颇的广告主，图3所示的分析会为其指出关键词购买结构上的调整方向、并提供待添加的样例词作为参考。
         </p>
         <p>
          <!--StartFragment -->
         </p>
         <pre><a href="http://cos.name/wp-content/uploads/2016/05/5IXBDTQ0DYNS0RLO5OQA8H.png"><img src="http://cos.name/wp-content/uploads/2016/05/5IXBDTQ0DYNS0RLO5OQA8H.png"/></a>

                  图3策略层面-截面-关键词购买结构-示意图</pre>
         <p>
          第二个方向主要考察广告主整体排名策略的激进程度，可用于推断竞争者的成本规模，并提供调整重点关键词排名的建议。首先，在整体投放的层面上，对各主要竞争对手的出价策略做出定位，具体参考图4。图中每一条线代表一个广告主；横轴数字代表广告排名，多条广告从左侧最上方开始、从左至右从上至下统一编号；纵轴表示抓取到的某个广告主的全部广告在各个排名上的分布比例。沿用行业层面分析部分的符号，表示抓取到第i个广告主关于第j个关键词的广告条数，表示抓取到的各条广告的排名。对广告主i，统计的频数分布，生成序列分别表示抓取到的广告主i所有广告中展现时排在第1位、第2位、……的广告条数，易知；图4中各排名对应的纵轴指标计算方式为。
         </p>
         <pre><a href="http://cos.name/wp-content/uploads/2016/05/E_6L682BN_YAIARDV.png"><img src="http://cos.name/wp-content/uploads/2016/05/E_6L682BN_YAIARDV.png"/></a>
                 图4策略层面-截面-关键词整体出价策略-示意图</pre>
         <p>
          如前所述，广告排名越靠前，广告主需要支付的成本通常越高。图4中曲线左侧位置越高，表明该广告主为所购买的关键词设定的出价策略越激进，从而其推广成本越高。当然，推广成本还受到购买关键词规模等因素的影响，但是进入本部分分析的通常都是购买关键词规模相当的竞争者，因此在图4的分析中并未这一因素。
         </p>
         <p>
          图4帮助广告主对竞品的总体出价策略做出判断。当广告主需要针对竞品出价情况来调整自身的出价策略时，可参考图5。图中最上方的条形代表使用品牌观察模型的客户A，其下的每一条形代表它关注的一个主要竞品，条形的长度代表广告主购买的关键词个数。每一个竞品的条形由蓝色、红色和黄色三个色块组成：蓝色部分代表该竞争对手购买、而客户A没有购买的关键词个数；与之相对应，竞品条形左侧的空白区域代表客户A购买、而该竞争对手没有购买的关键词个数。红色与黄色的部分合并在一起，表示客户A和该竞争对手同时购买的关键词个数，红色部分表示竞争对手的广告排位在客户A之上，黄色部分表示竞争对手的广告排位在客户A之下。每个色块均能对应到具体的关键词及其排名情况。
         </p>
         <pre><a href="http://cos.name/wp-content/uploads/2016/05/DGOG2ZX2_VIGJH@7.png"><img src="http://cos.name/wp-content/uploads/2016/05/DGOG2ZX2_VIGJH@7.png"/></a>

                  图5策略层面-截面-关键词排名占优情况-示意图</pre>
         <p>
          蓝色部分对应的关键词(尤其是那些多个竞争对手都购买的词)可能是客户A遗漏的行业重要关键词，可以考虑购买。黄色和红色部分的长度如果与客户A的条形长度非常接近的话，表示两者的业务和目标客户群非常相近。即使此竞争对手没有在主动竞争部分表现出很强的攻击意图，也应重点防范或主动加强攻击。黄色部分和红色部分的比例，以及落在两个部分的关键词分布是否合理，也是值得关注的问题。搜索黄色部分关键词，客户A的广告展现位置更靠上，付出的成本也更高。在这个区域内应仅保留那些对于促成购买或加深消费者的品牌印象有重要作用的关键词，为它们争取最好排名。
         </p>
         <p>
          第三个策略层面的应用，与广告创意有关。产出结果可以用来帮助客户了解自身的广告创意与品牌自我设定是否一致、主要竞品如何设定自身品牌形象以及是否有变化，总结市场上可供参考的创意点等。
         </p>
         <p>
          创意是整个SEM策略中最难以量化的部分，一个好的创意要言简意赅，同时富有感染力。投放人员在编写创意时，经常会通过搜索关键词，参考其他广告主创意的方式来寻找灵感。在实际工作当中，这些工作大多由投放人员手工进行，不但耗时多、效率低，而且限于搜索规模其采样的典型性和代表性都没有保证。品牌观察模型对创意文本的处理，模拟了分析师的工作，但大幅提升了其自动化程度、采样代表性更好、并且分析方式更加智能，具体处理方式如下：
         </p>
         <p>
          1、将抓取的广告数据，抽取掉时间及排名，将展现url替换为对应的广告主名称，按照“广告主+关键词+创意标题+创意描述+标题飘红+描述飘红”去重，并生成计数；再按照关键词，将关键词抽样中的关键词检索量补充到结果中。得到如表7所示的数据。
         </p>
         <pre><a href="http://cos.name/wp-content/uploads/2016/05/B7D2.tmp_.png"><img src="http://cos.name/wp-content/uploads/2016/05/B7D2.tmp_.png"/></a></pre>
         <p>
          表7的数据可供使用者按照在市场上的展现机会多少来筛选创意，但是对于需要掌握整个市场和主要竞争对手创意热点的使用者来说，它的数据量仍然过于庞大。以本例所使用的抽样词表和抓取规则为例，即使只考虑少量主要竞争对手，完整的表7也有数万行记录。同时，这种以整条创意为单位的统计结果，也不利于阅读者总结提炼。以表7中的创意为例，其中“专注IT教育”主打消费者对“专业”培训机构的诉求；“50万学员的共同选择”、“金牌讲师”则从用户规模和师资力量角度打消消费者对于“教学质量”的疑虑。也就是说，每一条创意都有可能糅合了多个诉求点，从创意中拆解出的诉求点及其对应的具体表达方式比完整的创意文本更适合阅读。接下来讨论如何对创意文本进行拆分、归类和汇总。
         </p>
         <p>
          2、拆分文本的关键问题之一是决定拆分的粒度。以字或单词为单位的拆分通常不能完整表达一个意思。以上例子中“专注IT教育”如果被拆分成了“专注”、“IT”和“教育”，阅读者将难以解读出“专业”的诉求点。因此字或单词不是合适的拆分维度。但如前讨论，拆分也不可过粗，因为过粗的拆分不利于归类汇总、总结规律。品牌观察模型采取的方式是：将创意文本(标题+描述)中的飘红部分替换为分隔符，将创意文本中与关键词一致的部分替换为分隔符，将创意文本中的所有标点符号替换为分隔符。将创意文本按照分隔符拆分开，与飘红及关键词合并。合并后的每一条文本，按照分隔符拆开，计算素材的频数，再以广告记录数和搜索量加权得到素材的曝光指数。最后，去掉广告主，按照素材对曝光指数进行加总。数据加工过程如表8所示：
         </p>
         <pre><a href="http://cos.name/wp-content/uploads/2016/05/9BA9.tmp_.png"><img src="http://cos.name/wp-content/uploads/2016/05/9BA9.tmp_-311x500.png"/></a></pre>
         <p>
          将素材分类补充到表8第4步的数据中，按照“广告主+创意点”对曝光指数进行加总，得到如图6所示的图形。图6中每一个柱体的高度代表某一个广告主在创意中使用某一类创意点的力度大小。每一列表示一个广告主如何塑造自己的品牌形象，每一行表示某一创意点是否是市场上的宣传热点或盲区。3、对表8中第5步数据按照曝光指数降序排列，即可截取到那些最多地被展现在消费者面前的素材；将第4步数据按广告主分开，对每个广告主素材按照曝光指数倒叙排列，截取每个广告主最集中使用的素材。将两部分素材合并后去重。在初次使用品牌观察模型时，需要对这些素材按照诉求进行归类，每一类诉求称为一个“创意点”；此后每次使用时，只需将新增的高频素材加入到分类中。新增高频素材本身代表了市场的异常变化，如有此类情况发生，应随同产生明细报表。
         </p>
         <pre><a href="http://cos.name/wp-content/uploads/2016/05/@@A@6PT8PRWCPH0D__M.png"><img src="http://cos.name/wp-content/uploads/2016/05/@@A@6PT8PRWCPH0D__M.png"/></a>

                         图6：策略层面-截面-创意-示意图</pre>
         <h4>
          <strong>
           <b>
            四、
           </b>
          </strong>
          <strong>
           <b>
            总结与讨论
           </b>
          </strong>
         </h4>
         <p>
          本文主要介绍了一种使用公开的SEM广告展现数据，推断广告主所在行业的SEM推广市场格局、评估各主要竞争对手竞争策略、并根据市场情况和竞争对手策略优化自身投放的方法。此类需求是众多重度依赖SEM广告以维持或扩大业务规模的广告主的通用需求，但业界此前并未有解决此类问题的系统性方法。本文所介绍的品牌观察模型根据SEM广告的基本业务逻辑，系统地回答了企业在市场和竞品监控上的主要问题。在开始的研发和准备阶段过后，绝大部分后续工作都可以自动执行，为广告主提供全面的市场监控、基本的策略判断和有的放矢的优化建议，从而有效地提升了SEM投放优化工作的效率。文中所述案例虽然来自职业教育培训行业，但方法本身具有通用性。
         </p>
         <p>
          本方法后续的改进方向有两个：首先，进一步提升方法的自动化程度。重度依赖SEM的行业一般都发展迅速、竞争激烈，行业的快速变化导致新的关键词、新的竞争对手、新的创意点都层出不穷；而与之相对应的关键词抽样、重点竞争对手遴选、创意点归类正是本方法中需要人工介入最多的部分，也是产出结果客观、及时的必要保证。这几个环节的自动化程度，是决定此项服务是否可规模化的关键因素。其次，加强市场环境及竞品相关数据与企业内部数据(推广的投入产出、用户的属性与行为特征等)的整合。营销是一个涉及到企业多个职能的漫长链条，SEM投放是其中非常靠近起始位置的一个环节，它和其他的环节都应对营收、投入产出比、市场份额等企业的核心业绩指标负责。在实际工作中，这些本应相互呼应配合的环节却经常是各自为政甚至互相对立。究其原因，没有层级清晰、关联合理的指标体系是一个重要的原因。因此需要从起始的环节开始逐步打通各业务环节的数据，并由最终结果反推投放优化方向。
         </p>
         <p>
          笔者所在的公司已使用品牌观察模型为多个行业、超过一百家大量投放SEM广告的客户提供过市场竞争环境评估和策略优化服务，得到了他们的一致认可。但是从数据分析的专业角度看，这一方法所使用的数据结构非常简单，分析手段也无非是简单的描述性统计方法。在“雕虫小技”被推崇备至的同时，笔者也多次遇到过从数据分析专业角度看非常出色的工作却得不到客户的欣赏和认可的情况。这些都并非是偶然现象。从国内企业对于数据的认知、积累和使用能力来看：一方面，近几年“大数据”这一概念受到了广泛的关注，业界也确实有一些标杆企业完成了非常出色的案例与实践。但同时，即使是在互联网等所谓的前沿领域当中，大部分企业的问题仍然是数据收集不够完备准确，或者有了数据却不知该如何使用。这些企业在数据应用的问题上，正处在一个“看上去很美”，却不知道该如何系统开展的阶段。类似本案例所使用的方法，虽然仅仅只使用了最简单的数据分析方法，但是对于客户来说它带来的几乎是从零到一的改变。它不但足够贴合客户的痛点，解决了某个一直困扰他们的具体问题，而且在某种程度上也帮助他们迈出了系统性地开展数据分析工作的第一步。
         </p>
         <p>
          类似的经历促使笔者思考一个问题：作为一个数据分析从业者，我们到底应该做什么以及怎么做，才能更快更好地帮助更多的行业和企业具备将数据转化为价值的能力，同时也让数据分析成为企业中必不可少的部门，增强数据分析人员在企业中的话语权？笔者相信，只有当数据的价值在各行各业各种规模的企业中都被充分地发挥出来的时候，才真正意味着商务领域数据分析行业全盛时代的到来。今天我们有幸站在这个时代的开端，它是否到来、何时到来就由每一位从业者的努力来决定。因此上，谨以此问与诸位同行共勉。
         </p>
         <h4>
          <strong>
           <b>
            参考文献
           </b>
          </strong>
         </h4>
         <p>
          [1]CNNIC(中国互联网络信息中心)，《中国互联网络发展状况统计报告(2016年1月)》,2016
         </p>
         <p>
          [2]易观智库.《中国新媒体市场数据盘点专题研究报告2015年第1季度》,2015
         </p>
         <p>
          [3]百度历年财报，http://ir.baidu.com/phoenix.zhtml?c=188488&amp;p=irol-reportsAnnual
         </p>
         <p>
          [4]张跃志.《2014中国教育市场发展报告》，2014
         </p>
         <p>
          [5]胡锦澜.《中国教育培训市场供需细分与市场前景分析》，2014
         </p>
         <div class="wumii-hook">
          <br/>
          <br/>
         </div>
        </div>
        <!-- .entry-content -->
        <footer class="entry-meta">
         <div class="author-info">
          <div class="author-avatar">
           <img src="http://sdn.geekzu.org/avatar/2fe058e9e383c85afa949b36e869432f?s=74&amp;d=monsterid&amp;r=g"/>
          </div>
          <!-- .author-avatar -->
          <div class="author-description">
           <h2 class="author-title">
            关于COS编辑部
           </h2>
           <p class="author-bio">
            本账户为COS编辑部公共账户，目前由朱雪宁任主编，王小宁任副主编，编辑有：冯璟烁、吴佳萍、张心雨、施涛、霍志骥、何通、冷静、尤晓斌、肖楠、邱怡轩、高涛、谢益辉等人，主要负责主站文章的规范化编辑以及相关论文、书籍、手册的整理、编纂、出版等工作。
            <a class="author-link" href="http://cos.name/author/editor/" rel="author">
             查看所有由COS编辑部发表的文章
             <span class="meta-nav">
              →
             </span>
            </a>
           </p>
          </div>
          <!-- .author-description -->
         </div>
         <!-- .author-info -->
        </footer>
        <!-- .entry-meta -->
       </article>
       <!-- #post -->
       <nav class="navigation post-navigation" role="navigation">
        <h1 class="screen-reader-text">
         文章导航
        </h1>
        <div class="nav-links">
         <a href="http://cos.name/2016/05/china-r-bj2016/" rel="prev">
          <span class="meta-nav">
           ←
          </span>
          第九届中国R语言会议（北京）
         </a>
         <a href="http://cos.name/2016/05/machine-learning-user-high-figure/" rel="next">
          基于机器学习的高价值用户自动发现
          <span class="meta-nav">
           →
          </span>
         </a>
        </div>
        <!-- .nav-links -->
       </nav>
       <!-- .navigation -->
       <div class="comments-area" id="comments">
        <div class="comment-respond" id="respond">
         <h3 class="comment-reply-title" id="reply-title">
          发表评论
          <small>
           <a href="http://cos.name/2016/05/sem-data-optimization-strategy/#respond" id="cancel-comment-reply-link" rel="nofollow" style="display:none;">
            取消回复
           </a>
          </small>
         </h3>
         <form action="http://cos.name/wp-comments-post.php" class="comment-form" id="commentform" method="post" novalidate="">
          <p class="comment-notes">
           <span id="email-notes">
            电子邮件地址不会被公开。
           </span>
           必填项已用
           <span class="required">
            *
           </span>
           标注
          </p>
          <p class="comment-form-comment">
           <label for="comment">
            评论
           </label>
           <textarea aria-required="true" cols="45" id="comment" maxlength="65525" name="comment" required="required" rows="8">
           </textarea>
          </p>
          <p class="comment-form-author">
           <label for="author">
            姓名
            <span class="required">
             *
            </span>
           </label>
          </p>
          <p class="comment-form-email">
           <label for="email">
            电子邮件
            <span class="required">
             *
            </span>
           </label>
          </p>
          <p class="comment-form-url">
           <label for="url">
            站点
           </label>
          </p>
          <p class="form-submit">
          </p>
          <p style="display: none;">
          </p>
          <p style="display: none;">
          </p>
         </form>
        </div>
        <!-- #respond -->
       </div>
       <!-- #comments -->
      </div>
      <!-- #content -->
     </div>
     <!-- #primary -->
     <div class="sidebar-container" id="tertiary" role="complementary">
      <div class="sidebar-inner">
       <div class="widget-area">
        <aside class="widget widget_text" id="text-3">
         <h3 class="widget-title">
          关注统计之都
         </h3>
         <div class="textwidget">
          <ul>
           <li>
            新浪微博
            <a href="http://weibo.com/cosname">
             @统计之都
            </a>
           </li>
           <li>
            人人网
            <a href="http://renren.com/cosname">
             @统计之都
            </a>
           </li>
           <li>
            Twitter
            <a href="http://twitter.com/cos_name">
             @cos_name
            </a>
           </li>
          </ul>
         </div>
        </aside>
        <aside class="widget widget_text" id="text-6">
         <h3 class="widget-title">
          微信公众平台
         </h3>
         <div class="textwidget">
          <img src="http://cos.name/wp-content/uploads/2013/04/qrcode-8cm.jpg"/>
          <p style="font-size:12px;margin-left:15px">
           微信号 CapStat
          </p>
          <p>
           我们将第一时间向您推送主站和论坛的精彩内容，以及统计之都的线下活动、竞赛、培训和会议信息。
          </p>
         </div>
        </aside>
        <aside class="widget widget_text" id="text-8">
         <h3 class="widget-title">
          站内导航
         </h3>
         <div class="textwidget">
          <ul>
           <li class="page_item">
            <a href="http://cos.name/cn/">
             中文论坛
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/videos/">
             视频
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/salon/">
             统计沙龙
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/books/">
             图书出版
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/training/">
             教育培训
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/about/">
             关于我们
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/donate/">
             捐赠
            </a>
           </li>
           <li class="page_item">
            <a href="http://cos.name/chinar/">
             R语言会议
            </a>
           </li>
          </ul>
         </div>
        </aside>
        <aside class="widget widget_links" id="linkcat-2">
         <h3 class="widget-title">
          友情链接
         </h3>
         <ul class="xoxo blogroll">
          <li>
           <a href="http://stat.ruc.edu.cn" target="_blank" title="中国人民大学统计学院网站">
            中国人民大学统计学院
           </a>
          </li>
          <li>
           <a href="http://rucdmc.net">
            中国人民大学数据挖掘中心
           </a>
          </li>
          <li>
           <a href="http://birc.gsm.pku.edu.cn/" target="_blank">
            北京大学商务智能研究中心
           </a>
          </li>
          <li>
           <a href="http://sam.cufe.edu.cn/" target="_blank" title="中央财经大学统计与数学学院网站">
            中央财经大学统计与数学学院
           </a>
          </li>
          <li>
           <a href="http://tjx.cueb.edu.cn/" target="_blank" title="首都经济贸易大学统计学院网站">
            首经贸统计学院
           </a>
          </li>
          <li>
           <a href="http://www.shookr.com/">
            数客网大数据社区
           </a>
          </li>
          <li>
           <a href="http://www.xueqing.tv/" target="_blank" title="数据科学在线学习平台">
            雪晴数据网
           </a>
          </li>
          <li>
           <a href="http://iera.name/" target="_blank" title="IERA是一个旨在普及、传播和增进工业工程知识的非营利性网站">
            IERA（直通IE）
           </a>
          </li>
         </ul>
        </aside>
        <aside class="widget widget_categories" id="categories-2">
         <h3 class="widget-title">
          全部分类
         </h3>
         <label class="screen-reader-text" for="cat">
          全部分类
         </label>
         <select class="postform" id="cat" name="cat">
          <option value="-1">
           选择分类目录
          </option>
          <option class="level-0" value="925">
           cos访谈  (4)
          </option>
          <option class="level-0" value="659">
           图书出版  (5)
          </option>
          <option class="level-0" value="379">
           数学方法  (14)
          </option>
          <option class="level-1" value="381">
           分析与代数  (1)
          </option>
          <option class="level-1" value="380">
           概率论  (9)
          </option>
          <option class="level-1" value="382">
           随机过程  (5)
          </option>
          <option class="level-0" value="210">
           数据分析  (81)
          </option>
          <option class="level-1" value="203">
           多元统计  (3)
          </option>
          <option class="level-1" value="42">
           数据挖掘与机器学习  (42)
          </option>
          <option class="level-1" value="36">
           生物与医学统计  (17)
          </option>
          <option class="level-1" value="35">
           计量经济学  (4)
          </option>
          <option class="level-1" value="296">
           金融统计  (3)
          </option>
          <option class="level-1" value="303">
           风险精算  (7)
          </option>
          <option class="level-0" value="177">
           模型专题  (15)
          </option>
          <option class="level-1" value="38">
           回归分析  (10)
          </option>
          <option class="level-1" value="41">
           时间序列  (2)
          </option>
          <option class="level-0" value="784">
           每周精选  (24)
          </option>
          <option class="level-1" value="183">
           可视化  (9)
          </option>
          <option class="level-0" value="967">
           沙龙纪要  (3)
          </option>
          <option class="level-0" value="18">
           经典理论  (46)
          </option>
          <option class="level-1" value="37">
           抽样调查  (3)
          </option>
          <option class="level-1" value="4">
           统计推断  (26)
          </option>
          <option class="level-1" value="236">
           试验设计  (7)
          </option>
          <option class="level-1" value="39">
           非参数统计  (3)
          </option>
          <option class="level-0" value="1">
           统计之都  (279)
          </option>
          <option class="level-1" value="884">
           中国R会议  (2)
          </option>
          <option class="level-1" value="885">
           中国R语言会议  (5)
          </option>
          <option class="level-1" value="446">
           出国留学  (3)
          </option>
          <option class="level-1" value="179">
           推荐文章  (90)
          </option>
          <option class="level-1" value="3">
           新闻通知  (75)
          </option>
          <option class="level-1" value="263">
           统计刊物  (10)
          </option>
          <option class="level-1" value="174">
           网站导读  (40)
          </option>
          <option class="level-1" value="204">
           职业事业  (51)
          </option>
          <option class="level-1" value="213">
           高校课堂  (9)
          </option>
          <option class="level-0" value="178">
           统计计算  (28)
          </option>
          <option class="level-1" value="40">
           优化与模拟  (15)
          </option>
          <option class="level-1" value="43">
           贝叶斯方法  (6)
          </option>
          <option class="level-0" value="378">
           软件应用  (116)
          </option>
          <option class="level-1" value="44">
           统计图形  (36)
          </option>
          <option class="level-1" value="110">
           统计软件  (83)
          </option>
         </select>
        </aside>
        <aside class="widget widget_recent_comments" id="recent-comments-2">
         <h3 class="widget-title">
          最新评论
         </h3>
         <ul id="recentcomments">
          <li class="recentcomments">
           <span class="comment-author-link">
            fineboom
           </span>
           发表在《
           <a href="http://cos.name/2016/06/use-shiny-fleetly-set-up-visual-prototype-system/#comment-7317">
            利用shiny包快速搭建可视化原型系统
           </a>
           》
          </li>
          <li class="recentcomments">
           <span class="comment-author-link">
            胡家新
           </span>
           发表在《
           <a href="http://cos.name/2016/06/r%e8%af%ad%e5%8d%83%e5%af%bb%e7%ac%ac%e4%b8%89%e6%9c%9f%ef%bc%9a%e5%bc%a0%e6%97%a0%e5%bf%8c%e7%a9%b6%e7%ab%9f%e7%88%b1%e8%b0%81%ef%bc%9f/#comment-7316">
            R语千寻第三期：张无忌究竟爱谁？
           </a>
           》
          </li>
          <li class="recentcomments">
           <span class="comment-author-link">
            <a class="url" href="http://www.zijiacha.com/category.php?id=6" rel="external nofollow">
             南糯山普洱茶
            </a>
           </span>
           发表在《
           <a href="http://cos.name/2016/06/r%e8%af%ad%e5%8d%83%e5%af%bb%e7%ac%ac%e4%b8%89%e6%9c%9f%ef%bc%9a%e5%bc%a0%e6%97%a0%e5%bf%8c%e7%a9%b6%e7%ab%9f%e7%88%b1%e8%b0%81%ef%bc%9f/#comment-7315">
            R语千寻第三期：张无忌究竟爱谁？
           </a>
           》
          </li>
          <li class="recentcomments">
           <span class="comment-author-link">
            J
           </span>
           发表在《
           <a href="http://cos.name/2016/05/value-of-the-reputation-from-the-data/#comment-7314">
            数据告诉你：高信誉的卖家应该收高价，还是收低价？
           </a>
           》
          </li>
          <li class="recentcomments">
           <span class="comment-author-link">
            <a class="url" href="http://gg" rel="external nofollow">
             Hilda
            </a>
           </span>
           发表在《
           <a href="http://cos.name/2013/01/drawing-map-in-r-era/#comment-7311">
            R时代，你要怎样画地图？
           </a>
           》
          </li>
         </ul>
        </aside>
        <aside class="widget widget_rss" id="rss-282869971">
         <h3 class="widget-title">
          <a class="rsswidget" href="http://cos.name/cn/topics/feed/">
           <img src="http://cos.name/wp-includes/images/rss.png"/>
          </a>
          <a class="rsswidget" href="http://cos.name/cn/topics/feed/">
           中文论坛新帖
          </a>
         </h3>
         <ul>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/417372/">
            处理时间数据和产生时间序列的问题
           </a>
          </li>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/6790/">
            《统计陷阱》下载 （How to lie with statistics）
           </a>
          </li>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/818/">
            统计学的世界（第五版）
           </a>
          </li>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/16574/">
            class(x) 返回值值是AsIs,AsIs代表什么，有什么用处？
           </a>
          </li>
          <li>
           <a class="rsswidget" href="http://cos.name/cn/topic/417366/">
            如何用R绘制一个分类算法的决策规则
           </a>
          </li>
         </ul>
        </aside>
        <aside class="widget widget_text" id="text-2">
         <h3 class="widget-title">
          登录/RSS
         </h3>
         <div class="textwidget">
          <ul>
           <li>
            <a href="http://cos.name/wp-admin/">
             登录
            </a>
           </li>
           <li>
            <a href="http://cos.name/feed/" title="使用 RSS 2.0 同步站点内容">
             文章
             <abbr title="Really Simple Syndication">
              RSS
             </abbr>
            </a>
           </li>
           <li>
            <a href="http://cos.name/comments/feed/" title="RSS 上的最近评论">
             评论
             <abbr title="Really Simple Syndication">
              RSS
             </abbr>
            </a>
           </li>
          </ul>
         </div>
        </aside>
       </div>
       <!-- .widget-area -->
      </div>
      <!-- .sidebar-inner -->
     </div>
     <!-- #tertiary -->
    </div>
    <!-- #main -->
    <footer class="site-footer" id="colophon" role="contentinfo">
     <div class="site-info">
      版权所有 © 2014 统计之都 | 由
      <a href="http://wordpress.org/">
       WordPress
      </a>
      构建 | 主题修改自
      <a href="http://wordpress.org/themes/twentythirteen">
       Twenty Thirteen
      </a>
     </div>
     <!-- .site-info -->
    </footer>
    <!-- #colophon -->
   </div>
   <!-- #page -->
   <p style="margin:0;padding:0;height:1px;overflow:hidden;">
    <a href="http://www.wumii.com/widget/relatedItems" style="border:0;">
     <img src="http://static.wumii.cn/images/pixel.png"/>
    </a>
   </p>
  </div>
 </body>
</html>